<lgrobol@parisnanterre.fr>Ce cours s’inspire entre autre
https://tei-c.org/guidelines/p5/
<p>Special Interest Groups (SIGs) :
jTEI, le journal de la TEI :
Concrètement, l’idée de la TEI c’est de fournir une boîte à outils pour la représentation numérique de documents textuels (au sens assez large).
Applications à plein de domaines : les guidelines sont très volumineuses et sophistiquées.
att.written regroupe les éléments pour lesquels ça peut faire sens de préciser un scribe. Ces éléments possèdent tous l’attribut hand qui sert à identifier ce scribe.OK, mais à quoi ça ressemble concrètement un document TEI
xmlns ?
C’est ce qu’on appelle un « espace de nom , un namespace.
En fait les éléments TEI on des noms à rallonge. Par exemple <p>, c’est le petit nom de <http://www.tei-c.org/ns/1.0:p>.
Pourquoi à votre avis ?
Plusieurs spécifications XML peuvent partager des attributs du même nom court. Par exemple <p> existe aussi dans la norme XHTML (une tentative ratée de décrire HTML en XML) mais avec des caractéristiques (par exemple des attributs) différentes.
Le fait d’avoir un nom long permet de ne pas les confondre.
Ainsi le <p> de XHTML est en fait un <http://www.w3.org/1999/xhtml:p>.
Évidemment on ne veut pas écrire ces noms à rallonge dans nos fichiers. Pour ça on peut déclarer des raccourcis :
<tei:TEI xmlns:tei="http://www.tei-c.org/ns/1.0">
<tei:teiHeader>
<!---...-->
</tei:teiHeader>
<tei:text>
<!--...-->
</tei:text>
</tei:TEI>Ici tei est déclaré comme abréviation pour http://www.tei-c.org/ns/1.0.
Et on peut aussi déclarer un espace de nom implicite, qui sera utilisé par défaut pour tous les noms pour lesquels on en précise pas d’autre :
Dans les documents TEI habituels, on utilise en général seulement l’espace de noms http://www.tei-c.org/ns/1.0 et xml:http://www.w3.org/XML/1998/namespace qui est déclaré implicitement en XML et contient les attributs suivants:
xml:lang pour la langue d’un élément.xml:space pour spécifier si les caractères blancs (espaces) sont pris en compte.xml:base pour spécifier l’URL de base pour les URL d’un élément.xml:id l’identifiant par défaut d’un élément.Comme en HTML, les documents TEI comprennent obligatoirement un en-tête (header) qui embarque les métadonnées du document. Il est beaucoup plus comple(t|xe) que celui de HTML.
L’en-tête TEI se compose au minimum d’une description du fichier électronique <fileDesc> composé de trois sections obligatoires :
<titleStmt> : titre (<title>), auteurice(s) (<author>) et responsables de la production du fichier.<publicationStmt>: détail de la publication du fichier, peut contenir des paragraphes<sourceDesc>: origine du document électronique, par exemple s’il s’agit d’une transcription d’un document papier.<teiHeader xmlns="http://www.tei-c.org/ns/1.0">
<fileDesc>
<titleStmt>
<title>The Strange Adventures of Dr. Burt Diddledygook: a machine-readable transcription</title>
<respStmt>
<resp>editor</resp>
<name xml:id="EV">Edward Vanhoutte</name>
</respStmt>
</titleStmt>
<publicationStmt>
<p>Not for distribution.</p>
</publicationStmt>
<sourceDesc>
<p>Transcribed from the diaries of the late Dr. Roy Offire.</p>
</sourceDesc>
</fileDesc>
</teiHeader>Un document TEI contient en général un (ou plusieurs) texte <text>.
Toujours comme en HTML, un texte a un corps (<body>), qui contient des structures textuelles de base comme les paragraphes (<p>) et des structures spécifiques suivant les genres :
<l>) pour la poésie.<sp>) pour le théatre.<text xmlns="http://www.tei-c.org/ns/1.0">
<body>
<p>For the first time in twenty-five years, Dr Burt Diddledygook decided not to turn up to the annual meeting of the Royal Academy of Whoopledywhaa (RAW). It was a sunny day in late September 1960 bang on noontime and Dr Burt was looking forward to a stroll in the park instead. He hoped his fellow members of theRAW weren't even going to notice his absence.</p>
</body>
</text>Un texte peut aussi optionnellement contenir un <front>, avec préface, table des matières, dédicace…
Maintenant, quand vous aurez besoin de représenter des documents textuels (et plus) sous forme numérique, vous pourrez utiliser un format TEI en :
Et comment on affiche toutes ces données ? C’est une histoire pour une prochaine fois
Pour chacun des chapitre 5 à 13 des guidelines, dire rapidement ce que contient le module décrit dans ce chapitre et quel(s) type(s) de documents il peut concerner.
Il n’est probablement pas nécessaire de lire tous ces chapitres en entier.